大数据技术驱动税收信用管理创新:逻辑、架构与实现路径
作者:
蔡 昌(中央财经大学财政税务学院)
曹晓敏(中央财经大学财政税务学院)
王爱清(宁德师范学院经济管理学院)
税收信用是社会信用的重要组成部分,加强税收信用管理对促进我国经济高质量发展、保证财政收入具有重要意义。随着数字技术的飞速发展,税收管理的数字化程度越来越高,尤其是电子发票平台与新电子税务局的试点运行,快速推动了智慧税务的建设步伐,税收信用框架与管理模式也将进行相应调整与制度创新。税务部门在未来5~10年内,将充分发挥税收大数据的驱动力,构建“信用+风险”的动态监控机制,以实现税收信用评价的数字化、流程化、智能化。因此,探讨大数据技术如何驱动税收信用管理创新,并构建以大数据技术为驱动的税收信用管理应用架构,对于推动我国税收信用管理的数字化、智能化具有重大意义。
大数据技术泛指能够对超大规模的数据进行收集、存储、分析,发掘数据中蕴含的价值,并以此为基础对决策作出指导的架构和技术,具有技术类型多、响应时间快、价值密度低等特点,在数据的收集、清洗、分析和应用等方面发挥着重要作用,为税收信用管理创新提供了强大的技术支撑。
(一)运用数据治理手段:改善税收信用管理质量
提升税收信用管理的基础是获取准确、全面的税收信用数据。大数据技术能够通过数据采集、数据清洗、数据挖掘等手段不断优化税收信用数据质量,为后续的税收信用管理创新提供数据基础与技术工具。
1.提高税收信用数据的采集效率。传统的税收信用评价主要依赖税务部门的内部数据,如纳税人的税务登记、税款申报、发票流通、税务检查等涉税数据,至多涉及海关、自然资源、市场监管、金融监管等与税收管理密切相关的其他政府部门的数据。上述数据中涉及的税收信用数据呈碎片化状态,分散在各政府部门的应用平台上,隶属不同的层次和序列,缺乏统一的数据标准。这些数据的覆盖范围非常有限,不足以支撑税收信用的细颗粒度分析。引入具有强大搜索功能的网络爬虫、神经网络等数据挖掘和数据采集技术可以提高税收信用数据的全面性,将数据采集范围扩大至企业内部生产耗费数据、网络交易平台数据等,税务部门能够据此从中挖掘出更多的隐藏数据价值。此外,传统的税收信用数据更新频率较低,通常按日或按月更新,而且依赖人工操作,无法满足实时对数据进行迅速分析的需求。而大数据技术能够通过设定程序或者应用网络爬虫技术自动抓取某些公开的涉税数据,在实现部分数据的自动化批量采集的同时,还能够对数据进行实时更新,快速提高税收信用数据的采集效率。
2.提高税收信用数据的准确性。传统的税收信用数据大部分依靠企业自行报送,缺乏及时、有效的验证环节。数字经济时代,税务机关可以运用数据清洗技术对采集到的数据进行格式转换、标准化、去重等预处理,还可以对数据进行填补缺失值、删除异常数据、验证数据范围和逻辑校验等。尤其是数据清洗技术可以发掘数据之间的关联性,实现交互验证,从而排除或修正错误信息,确保数据的一致性和准确性。例如,OpenRefine作为大数据技术的代表性技术,具有强大的数据清洗功能,可以实现合并列、拆分列、填充缺失值、删除重复值等操作,能够大大提高数据的清洗效率和质量,进而提升税收信用数据的准确性。
(二)引入大数据技术:推动税收信用动态管理
不同于传统技术对涉税数据进行简单分类、统计、查询等,大数据技术的价值更多体现在能够从海量税收信用数据中挖掘更有价值的信息,更好为后续的税收信用评价提供决策指导。
1.税收失信风险预警。现行税收信用管理模式倾向于事后的评价和惩戒,而大数据技术能够将税收信用管理环节前置,从而实现事前的风险防范。具体地,通过机器学习可以提取和总结历史风险特征,基于此建立风险预警指标体系,对相关企业进行实时风险监测,及时发现并预警企业潜在的税收风险,从而在事前有效阻止纳税人的失信行为。
2.税收信用动态评价。大数据处理技术具有速度快、响应时间短、批量化等特点。当有税收信用评价需求时,大数据处理技术可以迅速从数据库中提取最新数据进行高效计算,并实时输出评价结果,准确反映纳税人在特定时刻的税收信用状况。同时,综合运用基于特定算法的预警模型和生成式人工智能(ChatGPT)等工具,可以识别不同现实环境下的税收信用风险,并根据应用场景选择合适的评价指标和模型,以实现税收信用的持续监控与动态评价。
(三)重塑数据共享模式:构建税收信用协同共治机制
1.纳税人与税务机关间的数据共享机制。税务机关对纳税人的税收信用治理过程,其实就体现在税务机关与纳税人之间的数据共享与信息传递方面。一是借助大数据技术,税务机关在法律允许的范围内,可以直接获取纳税人的经营和财务信息,并准确界定纳税人的纳税义务。二是借助大数据技术,税务机关能够与银行系统实现连接,依据税收征管制度自动完成税款的扣缴与入库,减少无意的错报、漏报行为,降低纳税遵从成本。三是借助大数据技术,税务机关可以将税收信用评价结果以直观易懂的方式呈现给纳税人,引导纳税人进行高质高效的自我管理。
2.政府各部门间的协同共治机制。一方面,借助大数据技术并辅以云计算、区块链、人工智能等现代信息技术,搭建统一的数据平台,能够实现政府各部门间数据共享的规范化、系统化。同时,依靠基于政府各部门间协同共治的数据平台,税务机关能够轻松访问其他部门的数据信息,了解掌握纳税人相关履行社会责任情况、环境保护措施等信息,并将这些信息作为评估税收信用的评价指标。另一方面,在物联网、云计算等共享技术的加持下,税收信用评价结果能够迅速同步至其他政府部门,便于政府各部门执行联合激励和联合惩戒措施,也有助于扩大税收信用评价结果的影响力和威慑力。
总体而言,大数据技术至少能从改善税收信用数据质量、推动税收信用动态管理和构建税收信用协同共治机制三个方面驱动税收信用的数字化管理,发挥税收信用促进税收治理效能提升的激励机制。
二、大数据技术驱动税收信用管理创新面临的挑战
(一)税收信用的数据治理未成体系
1.数据质量与完整性难以保证。现阶段,在税收信用数据收集过程中,由于数据缺失、错误、关联度不高等质量问题的存在,影响了税收信用数据仓库的建设,进而影响税收信用评级的公正性与科学性。如何实现对税收信用数据仓库的实时更新和维护,更加动态、真实地反映纳税人税收信用情况的风险程度,尚是一个技术难题。此外,税收信用评价需要整合来自不同部门和系统的数据,而这些数据的可比性和一致性程度较低,造成税收信用数据的总体质量不高。
2.数据的安全和隐私保护不足。首先,纳税人的税收信用数据包含敏感信息,需要采取措施确保数据的安全存储、传输和访问,但目前有关数据安全和隐私保护方面的法律法规尚不健全。近年来,我国虽然相继颁布了相关数据保护法律,明确了数据安全保护的义务,降低了信息泄露的风险,但部门之间数据流通的安全保护问题尚存空白。尤其是税收信用数据作为政务数据的重要组成部分,部门之间的数据收集难、集成和共享难、开发和利用难等共性挑战也亟待解决。
(二)税收信用评价指标体系尚不完善
1.税收信用评价指标的科学性影响税收信用评级结果。当前,税收信用评价指标还不够系统全面,存在涉税指标较多,经营环境、行业状况、宏观经济等反映外部因素指标较少的现状,导致税收信用评价结果具有不准确性或滞后性,对创新税收信用管理工作带来影响。同时,囿于税收信用评价缺乏动态性指标与大算法模型,过度依赖历史数据而不是实时或近实时数据,算法模型无法捕捉潜在的税收信用风险及风险动态变化趋势,税收信用评价指标缺乏个性化、未能考虑纳税人的特定状态与特殊情况(如行业背景、地域差别、规模差别)等因素的客观存在,也导致了税收信用风险预警过度或不足,进而影响税收信用评级结果。
2.税收信用评价指标的适应性影响税收信用评价体系的灵活性。一方面,税收信用评价指标体系的权重分配固化,各个指标之间的权重调整缺乏灵活性,甚至长期不变,从而导致税收信用评价活动无法适应税收环境的变化和纳税人行为方式的转变;另一方面,税收信用评价指标体系的更新存在滞后性,尤其是面对国内外经济形势变化和税制变迁时,纳税人的行为模式和经济状况也会发生显著变化,税收信用评价体系可能因此受到干扰,失去灵活捕捉此类变化的敏锐性。
(三)缺乏共享机制与数据标准
1.税收信用数据共享的技术设施与数据标准有待完善。一方面,数据共享高度依赖现代信息技术手段的加持,但目前相关技术设施在税收信用方面的深度应用尚有不足,数据传输慢、数据存储量不足、数据加密安全性不高等问题依然存在,影响了税收信用数据共享的效率和安全性;另一方面,由于不同部门采用不同的数据格式和协议,导致部门间数据标准不统一、数据口径不统一、数据格式不统一的现实困境,对税收信用数据共享也形成了一定的障碍。
2.税收信用数据缺乏共享机制和统一数据接口。税收信用数据的收集和管理涉及多个政府部门,如市场监管、海关、金融监管等部门,但这些部门间的信息共享尚有“鸿沟”。例如,一些企业的信用信息在市场监管部门有记录,但因不同部门之间没有数据接口或数据接口不一致,以及缺少必要的数据共享机制,导致各部门间数据共享系统缺乏兼容性,无法共享到税务部门。
(四)税收信用体系缺乏动态评价与反馈机制
1.税收信用体系缺乏动态评价机制。动态评价机制依赖于税收信用评价指标体系的科学性与灵活性,以及基于大数据技术驱动的动态评价模型的建立。目前,大数据技术在税收信用评价中的应用尚不成熟,尽管区块链技术在去中心化、安全加密、防篡改、可追溯性方面具有优势,但目前并未将其完全嵌入税收信用的大算法模型,无法充分发挥区块链所具备的技术优势。同时,云计算技术在动态化管理方面虽具有天然优势,但云计算技术在税收信用领域的应用还不够深入,也并未深度嵌入税收信用评价指标体系,且缺乏有效的云平台和应用场景设计,从而导致云计算在支持税收信用数据的存储、共享和验证方面不成熟。缺少这些现代信息技术的加持,税收信用体系的动态评价功能未能得到有效发挥。
2.税收信用体系缺乏反馈机制。当前,税收信用体系因缺乏反馈机制与反馈渠道,即使纳税人对评价结果存在争议或不理解,税务机关也无法准确获悉纳税人对税收信用评价结果的反馈。这不仅影响了税收信用评价的公正性和纳税人参与税收信用评价的积极性,也影响了税务机关对税收信用评价结果的及时纠偏和动态修复。
税务机关通过整合云计算、区块链、人工智能等现代信息技术,可以构建基于大数据技术的税收信用管理应用架构。这是大数据技术驱动税收信用管理创新的根本前提和基本保障。按照以大数据技术为驱动的税收信用管理的逻辑秩序,税收信用管理应用架构涵盖税收信用数据仓库、税收信用数据溯源机制、税收信用动态评价机制、税收信用风险预警体系以及税收信用可视化体系五个关键模块。这五个模块共同构成了一个协同共治、共生共融的有机整体。
(一)税收信用数据仓库
大数据技术能够通过扩大税收信用数据采集范围、提高税收信用数据采集效率和准确性,进而拓展税收信用的数据基础并提高其质量。因此,基于大数据技术,税务机关可以构建一个数据覆盖面广、数据颗粒度细的税收信用数据仓库(详见图1,略)。
按照税收信用数据仓库的逻辑架构,其构建流程主要包括以下三个关键步骤。
步骤一:税收信用数据采集。根据不同的数据源,采用适当的大数据技术手段进行实时或定时的数据采集。例如:对于存储在各级税务机关征管系统中的纳税人基本信息、发票开具、税款申报等数据,直接进行采集、整理与分类;对于涉税法律法规、税收政策、税收统计数据和分析报告等,实时进行适配性采集与处理;对于来自海关、金融、市场监管等部门的第三方数据,通过数据接口实现数据共享,合并至税收信用数据仓库;对于互联网上的新闻报道、政府公告、企业财务报告等,通过网络爬虫技术进行定向抓取。
步骤二:税收信用数据治理。一是根据税收信用管理的需求对繁杂的海量数据进行预处理。例如,通过采用数据抽样技术,根据需求从原始数据中筛选出关键信息,摈弃不必要的字段,自动识别并纠正数据中的错误。二是基于我国税收政策的变化更新,制定统一的数据标准,对税收信用数据进行适当修正。例如,当平台系统数据存在数据缺失或者错误情形时,对分析结果影响较小的数据可以适当删除以保持数据间的匹配性,影响较大的关键数据缺失则采用逻辑估算方式予以补足。三是运用数据转换技术,确保数据格式满足分析工具或者平台系统的需求。
步骤三:数据仓库加载预处理数据。将经过预处理的涉税数据按照预定的模型加载到税收信用数据仓库,为后续的税收信用评价与应用提供数据支持。需要说明的是,税收信用数据仓库的架构与基本元素需要统一,以确保税收信用数据仓库的扩展性和第三方数据接入的便利性。此外,税收信用数据仓库还要依托大数据技术不断提升自身的数据共享能力。例如:采用数据压缩技术对税收信用数据进行压缩,加快传输速度;采用分布式存储系统或云存储系统,进一步提高税收信用数据存储和检索的效率;采用开放式应用程序接口(API)和数据集成工具,实现税务部门同其他部门间数据的无缝对接、快速传输与数据集成。
(二)税收信用数据溯源机制
提升税收信用管理质量的关键在于确保税收信用数据的真实性与溯源存证。税收信用数据的可追溯性是保证数据的唯一性、准确性并进行后续税收信用管理的基础。大数据技术和区块链技术都是数据处理的工具,大数据技术侧重于大规模数据集的分析与处理,以提取高质量、有价值的数据信息,而区块链技术则侧重于数据的安全性、不可篡改性和可溯源性。大数据技术通过记录数据的变更历史和操作日志,追溯数据的来源和修改记录;区块链技术通过不可篡改的区块链结构,追溯数据的源泉、完整度和处理过程。因此,在税收信用数据的分析应用中,可以将二者结合使用,实现更全面、更可靠的税收信用数据管理和追踪溯源。例如:通过将数据湖技术和数据流处理技术与区块链技术深度结合,可以实现对税收信用数据流的实时溯源和监控;通过将数据流的单个摘要或摘要链存储于区块链上,能够据以验证数据的真实性和完整性;通过将数字签名和加密技术与区块链技术结合,可以确保税收信用数据的安全性;通过对税收信用数据进行数字签名或加密,并将签名或密钥存储在区块链上,可以验证数据的来源并防止数据被篡改。由此,利用大数据技术和区块链技术,可以实现企业生产经营各环节以及政府部门执法各流程的信息可追溯,保证数据的唯一、可靠,防止税款流失,同时也能够保障纳税人的合法权益(详见图2,略)。
(三)税收信用动态评价机制
我国税收信用评价周期较长,缺乏足够的动态性。通过引入大数据、云计算、区块链等技术,可以实现税收信用的实时动态更新。大数据和云计算都具备分布式计算和存储能力,可以实现对海量数据的处理和存储,因此要相互结合、协同使用。可以说,云计算提供了强大的计算和资源存储能力,为大数据处理提供了基础设施和平台;大数据则可利用云计算的弹性和可扩展性,更好地分析、挖掘和处理大规模的数据。例如:结合云计算的计算能力和大数据分析技术,可以对税收信用数据进行深入分析和挖掘,从而发现纳税人的行为模式、规律和异常情况,对纳税人的信用和风险状况进行动态处理;利用云计算的实时数据处理和流式计算能力,通过对税收信用数据进行实时处理与分析,实现对纳税人行为和信用状况的实时监控(详见图3,略)。
此外,将大数据技术与区块链技术结合也可以更好地实现税收信用的动态评价。一方面,区块链技术对税收信用的动态评价主要依赖于智能合约机制,基于大数据分析的结果可以编写智能合约代码。智能合约能够根据纳税人的行为和信用数据,自动执行评价规则,并进一步更新税收信用的评级或得分。另一方面,大数据技术能够实现对纳税人涉税数据的深度抓取、处理并记入区块链,区块链的智能合约机制能够对税收信用评级进行动态更新与查询,二者相互连通,相辅相成,相互作用,以实现税收信用动态评价(详见图4,略)。
(四)税收信用风险预警体系
税收失信行为往往在发生前就有“前兆”,即纳税人表现出税收失信的一些典型特征。利用大数据技术能够及时识别纳税人潜在的税收信用风险,并对其进行个性化管理,从而有效阻断纳税人的失信行为,控制风险降低损失。基于大数据技术的税收信用风险预警体系(详见图5,略)主要涵盖以下内容。
1.收集纳税人的历史交易记录、税款申报等数据资料,并对数据进行清洗和处理,确保数据的准确性和一致性。
2.从数据中提取异常交易或异常申报数据,并根据其风险特征构建税收信用风险预警指标,以便后续的税收信用建模与分析。
3.应用交易数据与申报数据训练人工智能,最终构建能够识别纳税人异常行为的算法模型。
4.使用训练好的算法模型实时监测纳税人的行为是否存在异常。当指标阈值超出预警值或出现异常结果时,系统会自行启动预警机制,以便税务部门迅速作出风险应对措施。需要注意的是,算法模型的优化是一个持续迭代的过程,税收信用风险预警的及时性与准确性是建立在以大数据技术为重要驱动的税收信用数据仓库基础上的一种风险策略应对行为。
除依据算法模型对纳税人的基本财务数据进行分析外,ChatGPT等人工智能工具也能对风险预警起到一定的辅助作用。ChatGPT可以分析纳税人的聊天记录、电子邮件等与财务交易相关的文本数据,深入挖掘纳税人的语义和情绪,从而判断纳税人是否存在潜在的税收失信行为。例如,ChatGPT可以通过识别与某些交易相关的可疑词汇或纳税人的负面情绪词语,据以作出纳税人在一定程度上存在税收失信风险的判断。
税收信用风险预警一旦出现,税务部门将根据风险性质、类型和程度进行差异化处理,将税收信用管理从事后惩处转变为事前预防和行为纠偏。对于尚未造成损失的失信行为,及时予以干预并实施阻断措施;对于纳税人无意造成且危害较小的失信行为,提示纳税人及时纠正;对于性质恶劣且案情严重的失信行为,进行下一步侦查并根据侦查结果施以惩戒措施。
(五)税收信用可视化体系
利用大数据技术可以构建一个税收信用可视化体系,为公众提供透明的税收信用信息(详见图6,略)。可视化界面主要是运用大数据可视化工具(如Tableau、Power BI等)或编程库(如D3.js、ECharts等)来实现。具体流程如下。
1.确定目标。确定目标即明确税收信用可视化体系的目的,如帮助税务部门监控纳税人的税收信用状况、为纳税人提供税收信用评级参考、为公众提供公开透明的税收信用信息等。
2.数据收集。数据收集即为收集与税收信用评级相关的数据,如纳税人的基本信息、纳税记录、税收违法记录等。
3.数据处理。数据处理即对收集到的数据进行清洗、整合和分析,计算纳税守信度、税收违法率等关键指标,并根据预定的标准对纳税人进行税收信用评级。
4.可视化映射。可视化映射即选择合适的图表类型和视觉编码来展示税收信用评级结果。例如,使用折线图显示特定时间段的税收信用评分变化、使用柱状图展示纳税人的纳税守信度、使用饼状图展示不同信用等级的纳税人占比、使用地图展示各地区的税收信用状况等。
5.用户交互。用户交互即设计交互功能,允许用户通过筛选、排序、缩放等方式深入探索税收信用评级数据。例如,用户可以根据行业、地区或税收信用等级进行筛选,或点击特定纳税人以查看其详细的税收信用记录。
6.用户感知。用户感知即通过可视化界面,帮助用户快速了解其整体的税收信用状况,识别出具体的税收信用风险和税收信用评级较高的纳税人。
7.应用结果分析。应用结果分析即运用大数据技术对税收信用可视化结果进行深度分析,并将分析应用于政府监管、纳税人决策和公众监督,从而提高税收信用管理的效率和透明度。
此外,随着现代信息技术的快速发展和更新迭代,尤其是伴随着元宇宙等新型技术业态的出现,税收信用可视化体系的技术应用范畴也得以不断拓展。例如,利用元宇宙虚实相容的技术特征,可以在税收信用平台上建立一个社交平台,促进纳税人之间的社交互动和信息透明,鼓励纳税人相互交流和分享经验,营造良好的诚信纳税氛围。同时,还可以在税收信用可视化系统中设置激励机制,如对于税收信用度较高的纳税人提供奖励(如虚拟货币或虚拟物品),以激励纳税人更好地履行纳税义务。
(一)构建税收信用数据中枢
税收信用管理的关键是掌握全面系统准确的税收信用数据,在税收大数据的基础上构建税收信用数据中枢。发票数据是税收信用数据的重要来源,税务部门近年来开发建设的电子发票平台是形成税收大数据中枢的关键力量,不仅集成各市场主体之间的交易数据和发票数据,而且能够准确捕捉到全国各地区、各部门交易活动的关联性,实现税务、海关、金融、市场监管等多部门间的数据共享。电子发票平台建立在云环境下,依靠区块链技术的可溯源性、人工智能的算法模型监督、数据挖掘的风险识别等,为事前、事中、事后实施开票环节综合风险监控并阻断电子发票虚开行为提供了技术支撑。大数据技术实现了税收信用数据在电子发票平台上的初步集成,将会形成一张庞大的税收信用之网,为我国税收信用数据中枢提供数据之源。未来,税务部门应加快电子发票平台和全国统一新电子税务局的建设完善,从发票管理和税收征管视角构建税收大数据平台。同时,还要加强包括大数据技术在内的各类现代信息技术在税收领域的深度融合应用,形成以现代信息技术为支撑的税收大数据中枢,为进一步打造税收信用数据中枢奠定坚实基础。
(二)设计嵌入大数据技术的税收信用体系的行动方案
将大数据以技术工具的身份嵌入税收信用体系,是推动税收信用管理创新的重要行动方案之一。大数据技术具有渗透进生产力的特性和能力,能够对税收信用管理创新构成一种技术支撑与内在驱动。以电子发票平台为例,电子发票平台的建设从多维度引入了大数据技术,根据纳税人的税收信用状况采用算法模型测算并授予其一定时段的开票总额度,即对纳税人的开票金额进行总量控制与过程监管。这意味着大数据技术不仅渗透进电子发票平台,而且已经深度融入发票管理全过程,并从税收信用管理视角介入发票开具额度及行为管控,从根本上推动了税收治理机制与治理模式的变革。未来,还应将大数据驱动的算法模型嵌入税收信用体系,利用税收信用算法模型及时检测发现税收信用管理中的新增风险因素,据此优化税收信用评价结果,并自动优化税收信用算法模型,使之不断迭代演化。
(三)建立税收信用评级的动态调整与反馈制度
1.建立基于大数据技术的税收信用评级动态调整制度。首先,要利用机器人流程自动化(RPA)等自动化工具将数据和评级结果实时更新,并整合到云计算和区块链系统中。利用云计算的资源管理和动态调整技术、区块链的智能合约机制、人工智能的算法模型,进一步实现税收信用评级的动态化调整。其次,要根据数据冲击频率对数据库进行及时更新,保证税收信用数据仓库内数据的实时准确,并构建多元化的税收信用评价模型,实现不同应用场景下税收信用评价结果的动态调整,给因无意的税收失信行为而降低信用等级的纳税人一定的容错机会,建立基于大数据技术的税收信用评级动态调整制度。
2.建立基于大数据技术的税收信用评级反馈制度。反馈制度主要包括明确的反馈渠道、快速的反馈处理时间和有效的沟通机制,确保纳税人能够及时反馈评价结果,以便税务部门及时纠偏。建立税收信用评级反馈制度要从以下两个方面着手。一是要引入人工智能技术,利用机器学习、大算法模型,构建税收信用修复模型,根据纳税人的信息反馈情况,预测纳税人采取某些行为后其税收信用评价结果的变化,自动提示税收信用的可能风险点及税收信用修复结果。二是能够助力税务机关建立税收信用修复程序。在纳税人提出信用修复申请时,税务机关借助税收大数据可以自动检测纳税人是否达到信用修复要求,对完成信用修复的纳税人,更新其税收信用评价结果;对修复未达标的纳税人,指明其缺失项,引导其后续的税收信用修复行动。
(四)构建税收信用动态管理模式
一方面,要借助大数据技术,设计税收信用动态评价流程,驱动税收信用动态化管理模式,即依据税收信用评价指标的相机调整机理,构建税收信用评价指标组合的动态调整制度;另一方面,要根据指标的重要性为其设置动态权重,形成一种可根据经济结构变化、环境变化、税制变化自动调整指标权重的税收信用动态管理模式。具体而言,可从以下技术层面搭建驱动税收信用动态管理模式。一是通过机器学习技术自动识别、评判税收信用指标之间的关联性和相对影响力,利用机器学习对历史数据和实时数据进行分析,快速识别出对税收信用评价影响较大的指标,并根据其重要性进行指标组合及其权重的动态调整。二是引入区块链技术设置智能合约的预设规则,实现对税收信用指标权重的调整记录与存证。三是利用实时数据和数据挖掘技术,对纳税人的税收信用状况进行动态评估和监控,建立基于数据实时更新的税收信用评价模型,并持续优化,推动税收信用动态管理模式的完善发展。
(五)保障税收信用体系运维安全
一是要在税收信用数据仓库建设时,强化数据清洗、数据转换等技术的运用,对收集的税收信用数据进行纠错和验证,并建立有效的数据治理模式,确保税收信用数据的准确和完整。二是要建立税收信用数据实时监测和反馈机制,及时发现并有效清洗数据,解决数据缺失与不一致等问题,不断提升税收信用体系质量。三是要结合税收信用体系的完善情况建立税收信用数据定期备份机制,确保税收信用数据的完整性和可恢复性。例如,建立多重防火墙、在云存储中使用先进的加密算法如高级加密标准(AES)来保护企业和个人的隐私,设置访问控制机制确保数据的安全准入访问,即只有经过授权的人员和程序才可以接触、访问数据等。四是针对非法入侵行为,要及时部署入侵检测系统进行实时警报或采取其他监控措施加强安全管理和风险防范。如在公开涉税信息时,采用匿名化、数据脱敏、身份验证等程序,对敏感数据进行脱敏处理,减少身份暴露风险,以保护纳税人的隐私,进而达到保障税收信用体系运维安全的目的。
(本文为节选,原文刊发于《税务研究》2023年第12期。)
欢迎按以下格式引用:
蔡昌,曹晓敏,王爱清.大数据技术驱动税收信用管理创新:逻辑、架构与实现路径[J].税务研究,2023(12):57-65.
-END-
●促进医药制造业高质量发展的税收政策与服务建议——基于湖南省医药制造业的调研
●运用税收大数据优化纳税信用管理服务的实践与思考——基于贵州探索建立“纳税信用管家”服务的调查
●不动产民事执行中的税额确定与税收优先权问题初探——以一起不动产产权过户纠纷案为例
●建设标准化“枫桥式”税务分局的实践策略——基于国家税务总局富平县税务局的调查
●县级税务机关在推进税收现代化中的税费征收监管资源优化——基于国家税务总局莒县税务局的调查